Escalado de cómputo en tiempo de prueba para ASR con Transformers en bucle
Optimiza el reconocimiento de voz con LARM: un Transformer en bucle que escala el cómputo en tiempo de prueba, mejorando la tasa de error de palabras.
Optimiza el reconocimiento de voz con LARM: un Transformer en bucle que escala el cómputo en tiempo de prueba, mejorando la tasa de error de palabras.
Descubre cómo Latent Reward Steering optimiza el razonamiento de LLMs al promover comportamientos cognitivos implícitos.
Descubre cómo las medidas de incertidumbre en tiempo de inferencia se alinean con la incertidumbre humana y mejoran la calibración en grandes modelos de lenguaje.
Descubre cómo las transformaciones de probabilidad inducidas en tiempo de inferencia en LLMs siguen patrones log-ratio reproducibles. Un análisis empírico de 4,975 problemas.